Introducción
El acceso al microcrédito en contextos donde el apoyo financiero no está disponible para las personas marginadas puede ser una política importante para apoyar el bienestar de las poblaciones vulnerables. Una pregunta importante, sin embargo, es cómo seleccionan mejor las instituciones a las personas a quienes otorgar crédito y, lo que es más importante, si hay formas en que puedan apoyarlas para que tengan éxito.
En este proyecto, abordaremos estas dos preguntas al identificar las características comunes que comparten los microempresarios exitosos utilizando un gran conjunto de datos históricos de una institución de microcrédito y al crear intervenciones para apoyar y promover algunas de estas características procesables en otros prestatarios de microcréditos. Para ello, nos asociamos con la Fundación BBVA, institución que está presente a través de diferentes entidades en varios países de América Latina y otorga microcréditos a emprendedores vulnerables. Las contribuciones esperadas de este proyecto son identificar y generar evidencia relacionada con algunos de los determinantes del éxito en el contexto de los microcréditos, y determinar cómo las instituciones pueden apoyar a las personas para ayudarlos a tener éxito en sus negocios. También esperamos arrojar luz sobre otras características que podrían ser útiles a la hora de elegir aprobar o no un crédito, lo que podría ser particularmente importante para poblaciones frecuentemente marginadas.
Estudiaremos los determinantes del éxito en el contexto de cuatro países diferentes de América Latina con un gran conjunto de datos de millones de microempresarios a lo largo de los años. Esto brinda una oportunidad única para analizar información a nivel individual en un área donde los datos suelen ser escasos. La mayoría de las personas de nuestra muestra provienen de entornos marginados, muchas veces sin acceso al crédito a través de instituciones privadas, y de áreas rurales en sus respectivos países. Si bien nuestro análisis se centrará en América Latina, esperamos que algunos de estos resultados puedan generalizarse a otras poblaciones del mundo, dado que los pequeños empresarios a menudo enfrentan desafíos similares.
El estudio se divide en dos fases: (1) identificación de las características asociadas con el éxito y (2) intervenciones destinadas a mejorar las posibilidades de éxito. La idea principal es que la fase 1 de este estudio informa las intervenciones para la fase 2. En particular, este reporte se refiere a los resultados de la primera parte del estudio (fase 1).
La primera parte del estudio (fase 1) será retrospectiva. Nos enfocaremos en los clientes existentes para identificar las características que están asociadas con el éxito, medido tanto como el pago oportuno del crédito, así como el aumento de sus activos y negocios en general. En términos de datos, esta fase del estudio se basa en datos históricos proporcionados por la Fundación BBVA desde 2013 hasta 2021. Este es un conjunto de datos único ya que contiene millones de clientes de microcrédito en América Latina. Lo complemetamos con encuestas aplicadas a una muestra representativa de clientes existentes (n = 2,200). Utilizando estos datos, identificaremos características compartidas para el grupo categorizado como individuos “exitosos” y dividiremos estos atributos en categorías procesables y no procesables. Aunque las características identificadas en la fase 1 no proporcionarán evidencia causal de los determinantes del éxito, ayudarán a informar el diseño de diferentes intervenciones que se probarán en la segunda parte de este estudio (fase 2).
Selección de Muestra y Diseño Encuestas
En base a los datos entregados por la Fundación BBVA, se categorizaron a los clientes en base a su nivel de éxito (e.g. Exitoso, No Exitoso, Un crédito, Sin información). Para los clientes con más de un crédito, fueron categorizados como exitosos aquellos microemprendedores sin mora y cuyo capital había crecido entre un crédito y otro crédito; de igual forma, clientes con mora o sin crecimiento fueron categorizados como no exitosos. Se incluyó también en la muestra una lista reducida de clientes que las oficinas calificaron como Exitosos según sus propias medidas, siendo clasificados como exitosos subjetivos. A continuación se describen las categorías utilizadas en el análisis, donde todos las categorías a excepción de “No exitoso” son considerados “Exitosos”:
- Exitoso (más de un crédito): Cliente con más de un crédito entre 2018 y 2020, sin mora y cuyo capital creció entre el primer crédito y el último.
- No exitoso: Cliente con más de un crédito entre 2018 y 2020, y que estuvo moroso en el periodo o cuyo capital no creció entre el primer y último crédito.
- Un crédito: Clientes con un solo crédito entre 2018 y 2021 que no contaron con mora durante el periodo de estudio. Esta categoría se refiere potencialmente a clientes “fugados”.
- Subjetivos: Clientes propuestos por cada oficina local de los microemprendedores que ellos consideran exitosos.
Las encuestas se realizaron en 4 países de América Latina (Colombia, Panamá, Perú, y República Dominicana), con aproximadamente 600 encuestas en cada país, con excepción de Panamá, donde solo se realizaron 400 encuestas4. Para lograr representatividad en cuanto a los tipos de clientes, se tomaron muestras representativas de las distintas categorías (con excepción de los subjetivos, que eran propuestos directamente por las oficinas), estratificados también por su área de negocio (Agrícola o No Agrícola). La muestra fue seleccionada también de manera representativa en términos de geografía, para abarcar distintas zonas del país.
A continuación se muestran los resultados agregados para todos los países.
Resultados
Descripción general
En total, se realizaron 2125 encuestas en todos los países como muestra el siguiente mapa interactivo. En el caso de Colombia, se realizaron 524 encuestas en diversas zonas del país, como muestra el siguiente mapa. Varias encuestas se concentran en Bogotá y Medellín, pero otras zonas del país también fueron cubiertas. En Panamá, se completaron 400 encuestas, tanto en la zona este como la zona oeste del país. En Perú, se realizaron 596, principalmente en Lima, pero también en varias zonas rurales. Finalmente, en República Dominicana 605 clientes respondieron la encuesta.
Figura 1. Localización geográfica de encuestas en distintos países
Las encuestas fueron estratificadas según diferentes categorias: Exitoso, No exitoso, Un contrato, y Subjetivos. Además, dichas categorías fueron separadas según el tipo de actividad del cliente (agrícola o no agricola). La siguiente tabla muestra el número de encuestas por categoría:
| Categoría | N Encuestas |
|---|---|
| Exitoso - Agro | 124 |
| Exitoso - No Agro | 724 |
| No Exitoso - Agro | 193 |
| No Exitoso - No Agro | 598 |
| Subjetivo | 45 |
| Un Contrato - Agro | 85 |
| Un Contrato - No Agro | 356 |
El trabajo de campo se realizó entre Junio 2022 y Enero del 2023, con un peak de encuestas en Octubre. Si bien la mayor parte del trabajo de campo se realizó en la mayoría de los países entre Septiembre y Noviembre, hubo ciertas variaciones dependiendo del país5.
Figura 2. Fechas de aplicación de encuesta
Respecto a la caracterización de los clientes que respondieron la encuesta, estos tienen en promedio 47, con un rango entre 20 y 80 años de edad.
Figura 3. Distribución de edad de los participantes
En general, tienen un nivel educacional bajo, donde la mayoría alcanzó un nivel de educación secundaria o menor. También se observa una heterogeneidad importante entre países: Perú cuenta con clientes con mayor nivel educacional, mientras que en República Dominicana cerca de un cuarto de la muestra no reporta información educacional o reporta alguna otra alternativa.
Figura 4. Nivel educacional de los participantes por país
En cuanto a las áreas de los negocios, los clientes que respondieron la encuesta se dedican principalmente al comercio al por menor, seguido por el negocios agrícolas y servicios:
Figura 5. Áreas de negocio de participantes
Definición de Éxito
La gran mayoria de los clientes se considera exitoso (0.9%), mientras que un porcentaje menor no se considera dentro de esta categoría (2%).
Figura 6. ¿Se considera ud. exitoso?
Se les preguntó a los clientes de manera abierta por qué se consideraban exitosos, y la mayoría dio argumentos asociados al trabajo, logros y metas. La siguiente figura muestra una nube con las palabras más frecuentes en dicha respuesta. De los pocos clientes que declaran no considerarse exitosos, las palabras que más se repiten se refieren a metas, faltas, proyecto, e incluso la pandemia.
Figura 7. Nube de palabras para razones por las que se consideran exitosos/as
Para los pocos clientes que responden que no se sienten exitosos, la mayoría declara que se considerarían exitosos si es que lograran que su negocio fuera estable.
Figura 8. Para los que no se consideran exitosos - Se consideraría exitoso principalmente si antes de 5 años…
Para finalizar esta sección, se les preguntó a los participantes qué hace exitoso/a a una persona o a un negocio. La misma proporción de personas asocia el exito personal a la estabilidad del negocio como a la estabilidad del hogar. A la vez, cerca de un tercio de los clientes consideran que el éxito de un negocio recae en su crecimiento. Dichas respuestas son similares entre los clientes categorizados como exitosos y no exitosos, aunque clientes no exitosos tienden a darle mayor importancia al reconocimiento por la comunidad y al hecho que el negocio permita cubrir necesidades del hogar.
Figura 9. Percepción de persona y negocio exitoso
Factores de Éxito
Para analizar potenciales factores de éxito, se les preguntó a los participantes qué harían con los beneficios de su negocio. La gran mayoría de clientes categorizados como exitosos como también los no exitosos respondieron que reinvertirían esas ganancias en su negocio. Alrededor de un tercio de los participantes declaran que usuarían esas ganancias para invertir en el hogar o pagar deudas.
Figura 10. Cuando usted tiene beneficios en su negocio generalmente…
Según las respuestas de la encuesta, los participantes tienden a ser más optimistas que pesimistas, y una mayor proporción es menos aversa al riesgo. En cuanto a diferencias entre exitosos y no exitosos, las respuestas tienden a ser similares, con una propensión al riesgo levemente mayor para los clientes clasificados como no exitosos.
Figura 11. Preguntas acerca de optimismo y riesgo en los negocios
Para medir la ambición de los encuestados en base al crecimiento del negocio, se les preguntó a los clientes cuál sería el tamaño de su negocio si es que el crecimiento solo dependiera de ellos. La siguiente figura muestra que si bien la mayoría esperaría que su negocio fuera más grande que el tamaño actual, menos de un tercio de los que responden esperarían un crecimiento significativamente mayor.
Figura 12. Si el crecimiento dependiera solo de ud., ¿qué tamaño físico tendría en 5 años?
En cuanto al crecimiento de empleados, de los 1862 clientes que tienen un negocio, la gran mayoría tendría menos de 10 empleados en 5 años (75.3%). Sin embargo, se ve que hay una cola derecha muy larga en cuanto a ambición de crecimiento medido por número de empleados.
Figura 13. Si el crecimiento dependiera solo de ud., ¿cuántas personas trabajarían en el en 5 años?
Finalmente, en cuanto a alternativas de trabajo con contrato permanente, se les preguntó a los encuestados qué harían con su negocio si es que se les presentara la oportunidad de un trabajo estable con contrato. Más de un tercio de los encuestados responden que no aceptarían la oferta, mientras que más del 50% declaran que mantendrían su negocio actual en paralelo, ya sea administrado por ellos mismos o por otra persona.
Figura 14. Si se le presentara la oportunidad de trabajar en una empresa con un contrato permanente, ¿que haría?
Situación de la Empresa
En esta sección, se les pregunta a los clientes acerca del estado de su negocio actual.
En cuanto al año desde que el negocio opera, dos tercios de las personas que responden tienen su negocio previo al año 2017, y la mayoría lo comenzó desde cero.
Figura 15. Inicios del negocio actual
Si bien la mayoría de los clientes también declara un crecimiento en sus ventas y beneficios (principalmente moderado), un porcentaje relevante (~15-17%) reporta tener ventas menores que su primer año, lo que demuestra cierta heterogeneidad en cuanto al éxito autorreportado en términos de crecimiento.
Figura 16. Con respecto al primer año, las/los _____ de su negocio son:
Con respecto a empleados, 31.4% de los que responden declaran trabajar solos, mientras que una proporción importante (26.3%) trabaja con familiares sin salario. En la siguiente figura se muestra la distribución de empleados con salario (familiares o no familiares), para los negocios con al menos un empleado. Se puede observar que la gran mayoría de los negocios tienen menos de 5 empleados. La mayoría declara también que el número de trabajadores no ha aumentado desde el primer año.
Figura 17. Distribución de trabajadores con salario
Figura 18. Con respecto al primer año, el número de trabajadores con salario de su negocio es:
Perspectivas
En esta sección se les preguntó a los encuestados acerca de las perspectivas que tenían acerca de su negocio para el próximo año. En cuanto a la probabilidad de crecimiento, la mayoría cree muy probable (o incluso tiene la certeza) que sus ventas serán mayores el 2023 comparado con el 2022. La gran mayoría tampoco preve riesgos o debilidades (77.3%) y cree que hay suficiente demanda para su negocio (79.1%).
Figura 19. De 1 a 10, qué tan probable cree que sus ventas sean mayores en un año?
En cuanto a cómo utilizarían un potencial monto de inversión en su negocio, la mayoría (67.8%) lo usaría para aumentar activos (e.g. tierras, animales, maquinaria), seguido por un aumento de capital de trabajo (41.6%). Solo un 8.5% declara que aumentaría tecnologías y un 3.5% que pagaría un curso.
Figura 20. En qué areas invertiría un potencial monto?
Educación y Capacitaciones
La sección de educación y capacitaciones busca obtener información acerca de la preparación que los emprendedores tienen en relación al manejo de su negocio. Si bien cerca de un 40% de la muestra se considera competente, un porcentaje relevante (29%) reconoce solo tener conocimientos básicos.
Figura 21. Cómo califica su nivel de experiencia?
Con respecto a dónde adquirieron el nivel de experiencia que declararon anteriormente, la gran mayoría lo hizo en el trabajo, y solo un 20% a través de capacitaciones formales.
Figura 22. Dónde adquirió ese nivel de experiencia?
Se les preguntó a los clientes qué cursos les interesaría tomar en específico. Si bien la mayoría declara estar interesado en cursos relacionados directamente con negocio (e.g. manejo de clientes y proveedores, comercialización y temas productivos), un tercio de los que responden están interesados en cursos relacionados con educación financiera y manejo de crédito y ahorro, y alrededor de un 17% está interesado en cursos que los ayuden a implementar nuevas tecnologías. Alrededor de un cuarto de los clientes, sin embargo, no está interesado en cursos de capacitación. Es importante recalcar también de los que están interesados en cursos, un 53.4% estaría dispuesto a pagar algo por dicho curso.
Figura 23. Le interesaría tomar un curso en… ?
Finalmente, también se testeó el conocimiento de los encuestados a través de dos preguntas:
Supongamos que tiene 100 dólares en una cuenta de ahorro y el tipo de interés es 2% anual. Después de 2 años, ¿cuanto cree que tendría en su cuenta si dejara que el dinero “crezca”? (Opciones: (a) Más de $104, (b) Exactamente $104, (c) Menos de $104, (d) No sé)
Imagine que la tasa de interés de su cuenta de ahorro es un 1% y la inflación es el 2% anual. Después de un año, con el dinero en su cuenta, ¿podría comprar? (Opciones: (a) Más que hoy, (b) Lo mismo que hoy, (c) Menos que hoy, (d) No sé)
Como se observa en la siguiente figura, poco más de un tercio de los encuestados responden correctamente.
Figura 24. Preguntas de conocimiento financiero
Prácticas Empresariales
Juegos de Riesgo
Finalmente, al finalizar la encuesta, se les preguntó a los encuestados si es que deseaban responder un par de preguntas adicionales que les permitirían ganar dinero real. Si es que aceptaban, el encuestador procedía con tres juegos distintos, y si es que no aceptaban, se les entregaba una cantidad fija de pago por su participación.
Los juegos realizados tienen como objetivo identificar el nivel de riesgo que los clientes están dispuestos a tomar. Para cada país se dieron premios correspondientes en la moneda local, con un valor esperado de los premios de alrededor de US$7.
Juego I - Aversión al riesgo
El primer juego consiste en darle la opción al encuestado de escoger entre un valor fijo o un premio que depende del resultado de una moneda. El valor esperado del premio para cada opción es prácticamente constante, pero la varianza aumenta a medida que se avanza en las opciones. Los escenarios eran los siguientes:
- (A): $5 seguro o (B): $4 si sale cara o $6.5 si sale sello
- (A): $5 seguro o (B): $3 si sale cara o $8 si sale sello
- (A): $5 seguro o (B): $2 si sale cara o $10 si sale sello
- (A): $5 seguro o (B): $1 si sale cara o $12 si sale sello
- (A): $5 seguro o (B): $0 si sale cara o $13 si sale sello
Se observa según las respuestas de los encuestados que si bien hay una distribución bastante uniforme en cuanto al riesgo, hay un porcentaje importante (22.4%) que tiene una mayor propensión al riesgo.
Figura 25. Respuestas en Juego I
Analizando las mismas distribuciones en términos de éxito, utilizamos un modelo lineal de probabilidades (LPM) para analizar la asociación entre riesgo y éxito6:
\[Exito = \beta_0 + \beta_1Risk_1 + \beta_2Risk_2 + \beta_3Risk_3 + \beta_4Risk_4+\beta_5Risk_5 + \varepsilon\] El coeficiente \(\beta_0\) representa la probabilidad promedio de un cliente de ser categorizado como exitoso si es que no toma ningún riesgo (i.e. elige la opción de $5 fijo), mientras que \(\beta_i\) representa la diferencia en probabilidad de ser considerado exitoso entre clientes que eligen la opción \(i\) de riesgo vs los que no eligen arriesgarse. Si es que dichos coeficientes son estadísticamente distintos de cero, indicarían que hay una diferencia significativa entre clientes que toman distintos niveles de riesgo y su probabilidad de ser exitosos.
Como se observa en los siguientes resultados, no hay una diferencia significativa entre los distintos grupos de riesgo (\(\beta_1\) a \(\beta_5\)).
Figura 26. Coeficientes LPM para aversión al riesgo
Juego II - Aversión a la pérdida
En el segundo juego, se le entrega al encuestado $20 y se le da la oportunidad de ganar $10 más. Para esto, se le muestra los siguientes 5 escenarios en los cuales tiene que escoger una de las dos alternativas (A o B). Finalmente, se selecciona de manera aleatoria la opción que se jugará y recibe el pago de acuerdo a este resultado.
- (A): No perder nada o (B): Ganar $10 más si sale cara o perder $20 si sale sello
- (A): No perder nada o (B): Ganar $10 más si sale cara o perder $16 si sale sello
- (A): No perder nada o (B): Ganar $10 más si sale cara o perder $12 si sale sello
- (A): No perder nada o (B): Ganar $10 más si sale cara o perder $8 si sale sello
- (A): No perder nada o (B): Ganar $10 más si sale cara o perder $4 si sale sello
En la siguiente figura se observa que los clientes que respondieron la encuesta son en gran parte aversos a la pérdida. Por ejemplo, en el primer escenario (mayor riesgo) solo un 37.7% estuvo dispuesto a tirar una moneda, y solo cuando se llega al quinto escenario (menor riesgo) la proporción de personas dispuestas a arriesgar se equipara con las que no están dispuestas.
Figura 27. Respuestas en Juego II
En base a dichas respuestas, construimos una variable de aversión a la pérdida, con niveles de 0 a 5, donde 0 representa la persona que nunca escoge lanzar la moneda, 1 la persona que decide arriesgarse en el caso menos riesgoso, etc. De la misma manera que en el caso anterior, utilizamos un modelo de probabilidad lineal:
\[Exito = \gamma_0 + \gamma_1Loss_1 + \gamma_2Loss_2 + \gamma_3Loss_3 + \gamma_4Loss_4+\gamma_5Loss_5 + \varepsilon\] donde \(\gamma_0\) representa la probabidad promedio de que una persona sea categorizada como exitosa si nunca apuesta, y \(\gamma_i\) representa la diferencia en probabilidad de ser categorizado como exitoso entre las personas que deciden lanzar la moneda en el escenario \(6-i\)7.
En este caso se observa que si bien la mayoría de los coeficientes están en torno a 0, hay una diferencia significativa para los clientes que deciden apostar a las opciones de ganar $10 o perder $16 o incluso perder $20, las cuales son las opciones de mayor riesgo. Esto indica que clientes con menor aversión a la pérdida son categorizados como exitosos con una mayor probabilidad.
Figura 28. Coeficientes LPM para aversión a la pérdida
Juego III - Honestidad
Finalmente, el último juego consiste en 10 rondas, donde el encuestado debe adivinar el número que mostrará un dado. La persona deberá pensar un número entre 1 y 6, se generará el número al azar, y después la persona ingresará el número que había pensado. Si el número es igual que el que se muestra, la persona gana $1; si no es igual, la persona no gana nada.
Este juego tiene como objetivo medir el nivel de honestidad de los participantes. En promedio, si es que los participantes responden de manera honesta, deberíamos observar una distribución de porcentaje de aciertos en torno al valor esperado real (e.g. acertar 1 de 6 veces, en promedio, o 16.7%). Para contrastar los resultados, realizamos 100 simulaciones bajos los mismos parámetros que el juego. En este caso, observamos que la distribución observda (en naranjo) está sesgada con respecto a la distribución simulada. La primera tiene una cola más larga hacia la derecha, demostrando que ciertos clientes probablemente mienten respecto a sus respuestas para obtener el dinero.
Figura 29. Respuestas en Juego II
Utilizando el porcentaje de aciertos observados menos el porcentaje esperado (16.7%), construimos una variable categorica de honestidad de la siguiente manera:
- \(Hon_0\): La persona tiene un porcentaje de aciertos igual o menor a 20%
- \(Hon_1\): La persona tiene un porcentaje de aciertos mayor o igual a 20% y menor a 30%
- \(Hon_2\): La persona tiene un porcentaje de aciertos mayor o igual a 30% y menor a 40%
- \(Hon_3\): La persona tiene un porcentaje de aciertos mayor o igual a 40%
Al igual que en los dos juegos anteriores, usamos un modelo lineal de probabilidades para identificar la asociación entre honestidad y éxito:
\[Exito = \delta_0 + \delta_1Hon_1 + \delta_2Hon_2 + \delta_3Hon_3 + \varepsilon\]
El coeficiente \(\delta_0\) representa la probabilidad promedio de un cliente de ser categorizado como exitoso si es que es clasificado como honesto (\(Hon_0=1\)), mientras que \(\delta_i\) representa la diferencia en probabilidad de ser considerado exitoso entre clientes clasificados con un nivel de honestidad \(i\) vs los que caen en la categoria \(Hon_0\).
Como se observa en los siguientes resultados, no hay una diferencia significativa entre los distintos grupos de honestidad.
Figura 30. Coeficientes LPM para aversión al riesgo
Factores que determinan Éxito
En esta sección analizaremos las distintas variables que se correlacionan con distintas definiciones de éxito. También utilizaremos distintos métodos de Machine Learning para entender cuáles son las variables que mejor predicen estas distintas categorías. El objetivo es aprovechar la data detallada de las encuestas para identificar qué caracteristicas de los clientes están más altamente correlacionadas con éxito.
Exitosos subjetivos
Las distintas oficinas ofrecieron una lista de clientes que ellos determinaban como exitosos, a los que clasificamos como “Exitosos subjetivos”. De los clientes en esta categoria, 45 fueron encuestados (22 en Colombia y 22 en Perú, y solo 1 en Panamá). A continuación, comparamos algunas características de estos clientes con los clasificados como No exitosos según nuestra clasificación inicial. Como se observa en la siguiente tabla, clientes categorizados como exitoso subjetivo son más jovenes, y tienden a acceder a más y mejores créditos (mayor monto). Algo interesente es que no se observan diferencias significativas en activos, por ejemplo, en el primer crédito, pero sí en el último crédito al que tenemos acceso. Estos clientes también tienden a ser más honestos y tienen menor aversión al riesgo. En general, clientes clasificados como exitosos subjetivos tienden a utilizar la tecnología en distintas áreas de su negocio, comparados con clientes no exitosos. Finalmente, son menos propensos a definir el éxito de una persona como aporte a la comunidad, y tienen mayor ambición de crecimiento, esperando que su negocio crezca mucho más del tamaño actual comparado con su contraparte.
| Media | SD. | Media | SD. | Diff. | p | |
|---|---|---|---|---|---|---|
| Edad | 47.208 | 12.487 | 43.022 | 10.931 | -4.186* | 0.017 |
| Mujer | 0.535 | 0.499 | 0.600 | 0.495 | 0.065 | 0.395 |
| Soltero/a | 0.213 | 0.410 | 0.289 | 0.458 | 0.076 | 0.282 |
| Casado/a | 0.313 | 0.464 | 0.378 | 0.490 | 0.065 | 0.392 |
| Núm. créditos | 6.293 | 3.924 | 8.535 | 8.087 | 2.242+ | 0.078 |
| Monto 1er crédito (SD) | -0.052 | 0.833 | 0.942 | 1.974 | 0.995** | 0.002 |
| Monto últ. crédito (SD) | -0.114 | 0.845 | 1.368 | 2.466 | 1.481*** | <0.001 |
| Tot. activos 1er crédito (SD) | -0.057 | 0.938 | 0.207 | 0.964 | 0.264 | 0.124 |
| Tot. activos últ. crédito (SD) | -0.048 | 0.955 | 0.613 | 1.280 | 0.661** | 0.003 |
| Tot. ventas 1er crédito (SD) | -0.072 | 0.947 | 0.698 | 1.896 | 0.770* | 0.021 |
| Tot. ventas últ crédito (SD) | -0.125 | 0.868 | 0.878 | 1.521 | 1.003*** | <0.001 |
| Total trabajadores pagados | 1.430 | 2.889 | 2.267 | 2.871 | 0.837+ | 0.063 |
| Uso medio de pago virtual | 0.240 | 0.427 | 0.422 | 0.499 | 0.183* | 0.020 |
| Tiene pagina web | 0.184 | 0.388 | 0.356 | 0.484 | 0.172* | 0.024 |
| Compra insumos online | 0.133 | 0.340 | 0.267 | 0.447 | 0.134+ | 0.055 |
| Ayuda de amigos/familia por dificultades en negocio | 0.247 | 0.432 | 0.289 | 0.458 | 0.042 | 0.554 |
| No he tenido dificultades | 0.132 | 0.339 | 0.022 | 0.149 | -0.110*** | <0.001 |
| Crecimiento (ambición) | 0.285 | 0.452 | 0.422 | 0.499 | 0.137+ | 0.078 |
| Deshonestidad (proxy) | 2.421 | 2.960 | 1.133 | 1.687 | -1.287*** | <0.001 |
| Aversión pérdida (-) | 3.022 | 2.171 | 3.089 | 2.098 | 0.067 | 0.835 |
| Aversión riesgo (-) | 2.175 | 1.879 | 2.778 | 1.757 | 0.603* | 0.030 |
| Conocimiento financiero 1 | 0.332 | 0.471 | 0.267 | 0.447 | -0.065 | 0.346 |
| Conocimiento financiero 2 | 0.338 | 0.473 | 0.444 | 0.503 | 0.106 | 0.174 |
| Conocimiento financiero 1 (no sabe) | 0.316 | 0.465 | 0.356 | 0.484 | 0.040 | 0.592 |
| Conocimiento financiero 2 (no sabe) | 0.285 | 0.452 | 0.333 | 0.477 | 0.048 | 0.512 |
| Def. éxito comunidad | 0.200 | 0.400 | 0.067 | 0.252 | -0.134** | 0.002 |
| Def. éxito hogar | 0.406 | 0.491 | 0.444 | 0.503 | 0.039 | 0.616 |
| Def. éxito negocio | 0.394 | 0.489 | 0.489 | 0.506 | 0.095 | 0.227 |
Ahora, utilizando las distintas variables de la encuesta y datos administrativos, creamos un modelo de predicción de Random Forest para exitosos subjetivos, obteniendo una clasificación correcta de 89.1% y parámetros de sensibilidad y specificidad de 100% y 0%, respectivamente (ver Figura @ref(fig:rf_exitoso_subjetivo_roc)).
Figura 31. Importancia relativa de variables en modelo de Random Forest para predicción de Exitoso Subjetivo
Como se observa el la siguiente figura, las variables asociadas al primer crédito sobresalen como las más predictivas, como así también la edad y otras variables socioeconómicas (e.g. número de personas en el hogar y bienes durante la niñez). El número de trabajadores también sobresale en el modelo, como también el nivel de honestidad y la aversión al riesgo y a la pérdidad.
Figura 32. Importancia relativa de variables en modelo de Random Forest para predicción de Exitoso Subjetivo
Puntaje de Éxito
En esta sección utilizamos una definición objetiva acerca de éxito, basándonos en el crecimiento de los clientes en el tiempo. Para ello, calculamos el crecimiento (estandarizado) en monto de créditos y en los activos de un cliente. Con estas medidas, calculamos un puntaje continuo como medida de éxito, usando un el siguiente promedio ponderado:
\[PjeExito_i = \frac{1}{2}\Delta MontoSD_i + \frac{1}{2}\Delta ActivosSD_i\] donde ΔMontoSD y ΔActivosSD representan las diferencias del monto y los excedentes del negocio entre primer y último crédito, respectivamente, también estandarizados por país. Nos enfocaquremos en los clientes que estén en el top 10% de este puntaje.
En este caso utilizamos un modelo de Random Forest, como fue anteriormente descrito, para predecir esta nueva definición de éxito. En este caso, el modelo alcanza una clasificación correcta de observaciones entre 90.1% y 95.5% (Tabla X). Los resultados de las importancia de los predictores se muestra en la siguiente figura:
| País | % Predicción correcta |
|---|---|
| Colombia | 92.9 |
| Panama | 92.5 |
| Peru | 95.5 |
| Republica Dominicana | 90.1 |
Figura 33. Importancia relativa de variables en modelo de random forest para predicción de Top 10% en Score de Éxito
En este caso, las variables más relevantes están asociadas a la capacidad de ahorro y al conocimiento y manejo del negocio. La siguiente tabla muestra el balance entre los dos grupos:
| Media | SD. | Media | SD. | Diff. | p | |
|---|---|---|---|---|---|---|
| ¿Ahorra usted mensualmente parte de sus ingresos? - No | 0.111 | 0.314 | 0.152 | 0.360 | 0.040 | 0.167 |
| ¿Ahorra usted mensualmente parte de sus ingresos? - Si | 0.259 | 0.438 | 0.358 | 0.481 | 0.098* | 0.013 |
| ¿Usted mantiene un libro con las cuentas de su negocio? - No | 0.416 | 0.493 | 0.382 | 0.487 | -0.034 | 0.400 |
| ¿Usted mantiene un libro con las cuentas de su negocio? - Si | 0.458 | 0.498 | 0.527 | 0.501 | 0.069+ | 0.094 |
| Qué tan probable cree que las ventas 2023 sean mayores a 2022? - prob 1-3 | 0.028 | 0.165 | 0.012 | 0.110 | -0.016+ | 0.099 |
| Qué tan probable cree que las ventas 2023 sean mayores a 2022? - prob 4-5 | 0.101 | 0.302 | 0.103 | 0.305 | 0.002 | 0.937 |
| Qué tan probable cree que las ventas 2023 sean mayores a 2022? - prob 6-7 | 0.162 | 0.368 | 0.188 | 0.392 | 0.026 | 0.411 |
| Qué tan probable cree que las ventas 2023 sean mayores a 2022? - prob 8-10 | 0.583 | 0.493 | 0.606 | 0.490 | 0.023 | 0.569 |
| ¿Cuánto estaría dispuesto a pagar por tomar un curso de 10 horas? - Moneda Local | 0.418 | 0.493 | 0.533 | 0.500 | 0.115** | 0.005 |
| ¿Cuánto estaría dispuesto a pagar por tomar un curso de 10 horas? - Nada | 0.363 | 0.481 | 0.315 | 0.466 | -0.048 | 0.213 |
| ¿En los últimos 3 meses usted visitó al menos un negocio para ver si están vendiendo productos nuevos? - No | 0.406 | 0.491 | 0.406 | 0.493 | 0.000 | 0.996 |
| ¿En los últimos 3 meses usted visitó al menos un negocio para ver si están vendiendo productos nuevos? - No tengo negocio/productor/parcela/tienda similar al mío cerca de mi | 0.028 | 0.165 | 0.042 | 0.202 | 0.014 | 0.375 |
| ¿En los últimos 3 meses usted visitó al menos un negocio para ver si están vendiendo productos nuevos? - Sí | 0.439 | 0.496 | 0.461 | 0.500 | 0.021 | 0.607 |
| ¿Usted sabe qué bienes obtiene la mayor ganancia por venta de artículos? - No | 0.133 | 0.340 | 0.073 | 0.260 | -0.060** | 0.007 |
| ¿Usted sabe qué bienes obtiene la mayor ganancia por venta de artículos? - Si | 0.741 | 0.438 | 0.836 | 0.371 | 0.096** | 0.002 |
| Tengo dificultad para mantener mi enfoque en proyectos que tardan más de unos pocos meses en completarse - No es en lo más mínimo como yo | 0.085 | 0.279 | 0.115 | 0.320 | 0.030 | 0.248 |
| Tengo dificultad para mantener mi enfoque en proyectos que tardan más de unos pocos meses en completarse - No se parece a mi | 0.457 | 0.498 | 0.491 | 0.501 | 0.034 | 0.407 |
| Tengo dificultad para mantener mi enfoque en proyectos que tardan más de unos pocos meses en completarse - Se parece a mi | 0.219 | 0.414 | 0.182 | 0.387 | -0.037 | 0.249 |
| Tengo dificultad para mantener mi enfoque en proyectos que tardan más de unos pocos meses en completarse - Se parece en algo a mi | 0.170 | 0.376 | 0.182 | 0.387 | 0.012 | 0.714 |
Selección vs Progreso
Un objetivo de este proyecto es identificar variables asociadas con el éxito de microemprendedores que no necesariamente estén relacionadas con las características por las que son seleccionados para recibir distintos créditos. En ese sentido, realizamos un ejericicio similar al anterior, buscando identificar las variables que más aportan a la predicción de éxito, pero para una muestra ajustada según sus características base.
Para esto, creamos dos grupos en base al crecimiento (estandarizado) de sus activos. El grupo “exitoso” corresponde a los clientes que están en el top 25% de crecimiento de activos, mientras que el grupo “no exitoso” corresponde a los clientes que están en el 25% inferior de la distribución.8.
La siguiente table muestra el balance entre los dos grupos después de realizar matching por las siguientes variables: Sector, nivel de pobreza, nivel máximo de educación, año del primer crédito, género, activos, patrimonio, excedentes, y saldo registrados en el primer crédito. Se utilizó un método de cardinality matching para obtener la mayor muestra posible bajo las restricciones de balance, que en este caso incluían una diferencia de medias de 0.1 SD máximo entre variables, y un balance de distribución categórica para sector, nivel de pobreza, y educación. El procedimiento también se hizo dentro de cada país, para que cada par matcheado perteneciera a la misma entidad.
| Media | SD. | Media | SD. | Diff. | p | ||
|---|---|---|---|---|---|---|---|
| Sector | 3.01 | 1.25 | 3.01 | 1.25 | 0.00 | 1.00 | |
| Edad | 47.63 | 12.43 | 47.19 | 12.60 | -0.45 | 0.73 | |
| Mujer | 0.59 | 0.49 | 0.59 | 0.49 | 0.01 | 0.92 | |
| Educación | 3.24 | 2.05 | 3.24 | 2.05 | 0.00 | 1.00 | |
| Pobreza 1er crédito | 4.16 | 1.12 | 4.16 | 1.12 | 0.00 | 1.00 | |
| Monto 1er crédito | 1143827.18 | 2175904.41 | 1164081.62 | 2326242.99 | 20254.44 | 0.93 | |
| Activos 1er crédito | 7678959.71 | 13470581.16 | 7188905.69 | 14538524.23 | -490054.02 | 0.73 | |
| Patrimonio 1er crédito | 5940899.08 | 10618948.25 | 5558344.81 | 10899511.98 | -382554.27 | 0.73 | |
| Saldo 1er crédito | 73249.16 | 299471.97 | 69586.22 | 213842.46 | -3662.95 | 0.89 | |
| Saldo 1er crédito (miss) | 0.51 | 0.50 | 0.52 | 0.50 | 0.01 | 0.92 | |
| Excedente Negocio 1er crédito | 391014.71 | 613266.72 | 404091.41 | 620467.99 | 13076.70 | 0.84 | |
| Excedente Negocio 1er crédito (miss) | 0.02 | 0.13 | 0.02 | 0.13 | 0.00 | 1.00 | |
| Año 1er crédito | 2016.63 | 2.31 | 2016.54 | 2.18 | -0.08 | 0.71 | |
| N | Pct. | N | Pct. | ||||
| País | Colombia | 68 | 36.0 | 68 | 36.0 | ||
| Peru | 58 | 30.7 | 58 | 30.7 | |||
| Republica Dominicana | 63 | 33.3 | 63 | 33.3 |
En el caso de este modelo, un 53.5% de las observaciones son categorizadas de manera correcta. Observamos que la ambición de los clientes en cuanto al crecimiento de su negocio es un factor relevante, al igual que el uso de tecnologia (que puede estar asociado a otras variables). Finalmente, el conocimiento financiero y la capacitación también parecen jugar un rol importante.
Figura 34. Importancia relativa de variables en modelo de Random Forest para predicción de Crecimiento de Activos (top 25% vs bottom 25%)
Otro ejercicio interesante es separar las predicciones anteriores por sector. Para ello, utilizamos los tres sectores más relevantes (Agrícola, Servicios y Comercio) y ajustamos las variables a nivel de sector. En este caso, para preservar un tamaño muestral mayor, comparamos el tercio superior vs el tercio inferior en cuanto a crecimientos de activos por sector. Utlizamos nuevamente cardinality matching para obtener la mayor muestra ajustada, utilizando una tolerancia de 0.2 desviaciones estandar para la diferencia de medias y fine balance en las mismas variables descritas anteriormente.
| Media | SD. | Media | SD. | Diff. | p | |
|---|---|---|---|---|---|---|
| País | 2.87 | 1.22 | 2.87 | 1.22 | 0.00 | 1.00 |
| Edad | 47.13 | 12.17 | 46.41 | 12.55 | -0.72 | 0.44 |
| Mujer | 0.61 | 0.49 | 0.60 | 0.49 | -0.01 | 0.82 |
| Educación | 3.18 | 2.05 | 3.18 | 2.05 | 0.00 | 1.00 |
| Pobreza 1er crédito | 4.14 | 1.10 | 4.14 | 1.10 | 0.00 | 1.00 |
| Monto 1er crédito | 679442.56 | 1659768.39 | 800114.68 | 2145601.51 | 120672.12 | 0.40 |
| Activos 1er crédito | 5316953.65 | 14063659.40 | 4172305.16 | 11315285.12 | -1144648.49 | 0.23 |
| Patrimonio 1er crédito | 4122911.88 | 10138708.03 | 3239252.62 | 8597319.16 | -883659.26 | 0.21 |
| Saldo 1er crédito | 54020.37 | 239168.32 | 62109.75 | 256245.21 | 8089.38 | 0.66 |
| Saldo 1er crédito (miss) | 0.52 | 0.50 | 0.55 | 0.50 | 0.03 | 0.37 |
| Excedente Negocio 1er crédito | 245306.04 | 459480.97 | 279049.98 | 544869.50 | 33743.94 | 0.37 |
| Excedente Negocio 1er crédito (miss) | 0.02 | 0.13 | 0.02 | 0.13 | 0.00 | 1.00 |
| Año 1er crédito | 2016.86 | 2.16 | 2016.65 | 2.13 | -0.21 | 0.18 |
La siguiente tabla muestra la precisión del modelo predictivo. Si bien el poder predictivo es limitado, las variables del modelo aumentan la predicción con respecto a una asignación aleatoria.
| Sector | % Predicción correcta |
|---|---|
| Agro | 61.9 |
| Comercio | 67.6 |
| Servicios | 65.2 |
La Figura @ref(fig:rf_top33_sector) muestra las variables más relevantes en términos de predicción para los distintos modelos.
Figura 35. Importancia relativa de variables en modelo de random forest para predicción de Top 33% en activos por sector
Comparando dichas variables
Autoreporte de Éxito
Finalmente, utilizamos una medida de autoreporte de éxito según la mismas respuestas de la encuesta. En este caso, creamos una variable binaria que toma el valor de 1 si es que la persona declara que las ventas de su negocio son muy superiores con respecto al primer año y 0 en otro caso. Al igual que en los modelos anteriores, utilizamos un modelo de Random Forest.
| País | % Predicción correcta |
|---|---|
| Colombia | 77 |
| Panama | 78.7 |
| Peru | 86.6 |
| Republica Dominicana | 70.1 |
Figura 36. Importancia relativa de variables en modelo de random forest para predicción de Exitoso auto-reportado
| Media | SD. | Media | SD. | Diff. | p | |
|---|---|---|---|---|---|---|
| ¿Cree usted que en este momento existe suficiente demanda/clientela para su actividad económica? - No | 0.165 | 0.371 | 0.078 | 0.269 | -0.087*** | <0.001 |
| ¿Cree usted que en este momento existe suficiente demanda/clientela para su actividad económica? - No se | 0.037 | 0.189 | 0.017 | 0.129 | -0.020* | 0.018 |
| ¿Cree usted que en este momento existe suficiente demanda/clientela para su actividad económica? - Si | 0.642 | 0.480 | 0.905 | 0.294 | 0.263*** | <0.001 |
| ¿Usted sabe qué bienes obtiene la mayor ganancia por venta de artículos? - No | 0.136 | 0.343 | 0.089 | 0.286 | -0.047** | 0.009 |
| ¿Usted sabe qué bienes obtiene la mayor ganancia por venta de artículos? - Si | 0.708 | 0.455 | 0.911 | 0.286 | 0.203*** | <0.001 |
| Cree que las ventas de su negocio en el 2023 serán mayores que las del 2022? - Iguales | 0.113 | 0.317 | 0.087 | 0.282 | -0.027 | 0.120 |
| Cree que las ventas de su negocio en el 2023 serán mayores que las del 2022? - Ligeramente menores | 0.011 | 0.106 | 0.000 | 0.000 | -0.011*** | <0.001 |
| Cree que las ventas de su negocio en el 2023 serán mayores que las del 2022? - Mayores | 0.546 | 0.498 | 0.617 | 0.487 | 0.071* | 0.015 |
| Cree que las ventas de su negocio en el 2023 serán mayores que las del 2022? - Menores | 0.020 | 0.139 | 0.006 | 0.075 | -0.014* | 0.010 |
| Cree que las ventas de su negocio en el 2023 serán mayores que las del 2022? - Muy mayores | 0.104 | 0.306 | 0.263 | 0.441 | 0.158*** | <0.001 |
| Cree que las ventas de su negocio en el 2023 serán mayores que las del 2022? - No sé | 0.049 | 0.216 | 0.028 | 0.165 | -0.021* | 0.045 |
| ¿Usted revisa el desempeño financiero de su negocio y analiza dónde hay áreas de mejora al menos una vez al mes? - No | 0.240 | 0.427 | 0.170 | 0.377 | -0.069** | 0.003 |
| ¿Usted revisa el desempeño financiero de su negocio y analiza dónde hay áreas de mejora al menos una vez al mes? - Si | 0.604 | 0.489 | 0.830 | 0.377 | 0.225*** | <0.001 |
| Imagine que todo sale bien, ¿qué tamaño físico tendría en 5 años? Más grande que el actual | 0.545 | 0.498 | 0.469 | 0.500 | -0.076* | 0.011 |
| Imagine que todo sale bien, ¿qué tamaño físico tendría en 5 años? Más pequeño que el actual | 0.005 | 0.073 | 0.011 | 0.105 | 0.006 | 0.321 |
| Imagine que todo sale bien, ¿qué tamaño físico tendría en 5 años? Mucho más grande que el actual | 0.264 | 0.441 | 0.475 | 0.500 | 0.211*** | <0.001 |
| Imagine que todo sale bien, ¿qué tamaño físico tendría en 5 años? No tengo un negocio actualmente | 0.135 | 0.341 | 0.008 | 0.091 | -0.126*** | <0.001 |
Perfiles de Clientes
Una pregunta interesante es si existen distintos perfiles de clientes, especialmente relacionados con su definición de éxito. Para analizar estas diferencias, comparamos a los grupos según sus respuestas a la pregunta acerca de a quién consideran una persona exitosa.
- Crecimiento: “Alguien que tiene estabilidad en su negocio”
- Hogar: “Alguien que tiene estabilidad en su hogar”
- Comunidad: “Alguien que es reconocida en su comunidad”
Para comparar a los, compararemos los resultados de los juegos, creando índices continuos para cada variable, donde la variable asociada a riesgo mide aversión al riesgo (un mayor número indica menor aversión al riesgo), la variable de pérdida mide aversión a la pérdida (un mayor número indica menor aversión a la pérdidad), y finalmente la variable honestidad, que mide qué tan probable es que un individuo sea deshonesto (un mayor número indica menor nivel de honestidad).
Como se ve en la siguiente figura, el grupo que tiene una mayor orientación comunitaria tiene una mayor aversión al riesgo y es ligeramente más honesto que los otros grupos. Sin embargo, ninguna de estas diferencias son estadísticamente significativas.
Figura 37. Promedio de índices de juego según grupos de definición de éxito personal
De la misma manera anterior, creamos tres categorías de clientes en base a sus respuestas de qué consideran un negocio exitoso:
- Crecimiento: “El negocio ha conseguido crecer”
- Mantener a la familia: “El negocio ha conseguido mantenerse” o “Permite cubrir las necesidad del hogar”
- Comunidad: “Ha generado un cambio positivo en la comunidad” o “Ha generado empleo”
Comparando los distintos grupos según su definición de éxito de un negocio, observamos patrones similares a los anteriores en términos de honestidad. En este caso, la diferencia entre el grupo de crecimiento y los otros dos grupos es estadísticamente significativa, mostrando que hay una asociación positiva entre asociar el éxito de un negocio al crecimiento y la deshonestidad.
Figura 38. Promedio de índices de juego según grupos de definición de éxito del negocio
En cuanto a la sobreposición de los dos grupos, la siguiente table muestra la relación entre las dos definiciones de éxito. Si bien en las categorías de crecimiento y hogar, la mayoría de los clientes tiene definiciones similares de éxito tanto en el ámbito personal como de negocios, se observa una alta heterogeneidad entre estas dos perspectivas.
Figura 39. Porcentaje de clientes en categorias de definición de éxito personal respecto a definición de éxito de negocio
Creamos también heatmaps para ver las diferencias entre grupos en diversas variables, como aversión al riesgo y la pérdida, honestidad, crecimiento del negocio y crecimiento del número de empleados. Para los grupos de definición de éxito personal, se observa que hay diferencias en riesgo y en el score de éxito anteriormente descrito, donde los clientes del grupo Crecimiento tienden a tener un mayor score de éxito que los otros dos grupos, y el grupo de Comunidad tiende a ser el más averso al riesgo.
Figura 40. Heatmap para diferencias en características por grupo segun definición de exito personal
En el caso de los grupos creados en base a la definición de éxito del negocio, observamos que hay diferencias sustantivas en cuanto a crecimiento del negocio y del número de empleados en el negocio, donde el grupo Crecimiento supera a los otros dos grupos. Al igual como fue descrito anteriormente, se ven diferencias en honestidad y también en el score de éxito. Cabe notar que también se observa una diferencia en días de mora, donde el grupo Crecimiento tiende a tener un promedio de días de mora superior a los otros dos grupos.
Figura 41. Heatmap para diferencias en características por grupo segun definición de exito del negocio
University of Texas at Austin, m.bennett@austin.utexas.edu↩︎
University of Texas at Austin, william.fuchs@mccombs.utexas.edu↩︎
Universidad de Navarra, jmillan@…↩︎
Debido a problemas de paralizaciones y cortes de camino durante el trabajo de campo, se tuvo que limitar la muestra original↩︎
Debido a huelgas nacionales en Panamá, se tuvo que extender el trabajo de campo a Diciembre y Enero, mientras que Perú cerró la primera semana de Diciembre.↩︎
En este caso, excluímos a clientes con un solo contrato↩︎
En este caso, como el escenario 1 es el más riesgoso y el escenario 5 es el menos riesgoso, se indexan las opciones según menor riesgo (1) a mayor riesgo (5)↩︎
Tomamos las colas de la distribución para asegurarnos que los grupos son suficientemente distintos en cuanto a su crecimiento de activos↩︎